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Ji XE. 为 开发 适当 的 生物 学 工具 以 探索 辣椒 对 水 涝 胁迫 应 答 的 分 子 机 制 ， 该 文 对 不 同 淹 水 处 理 的 
辣椒 样本 进行 转录 组 分 析 ， 获 得 了 丰富 的 序列 数据 ， 并 在 此 基础 上 对 SSR 分 子 标记 进行 挖掘 。 结 果 
表明 : CD) 辣椒 转录 组 检测 共 获 得 128 939 条 Unigene， 其 总 全 长 与 均 长 以 及 GC 含量 分 别 是 55 082 
725 bp. 1 101 bp 和 40.57%。 与 七 大 功能 数据 库 进 行 比较 , 分 别 有 102 123 (NR: 79.2096) 、110 157 
(NT: 85.4394) . 70 203 (SwissProt: 54.45%) , 73 539 (КОС: 57.0394) . 77 646 (KEGG: 60.22%), 
77 442 (GO: 60.06%) 以 及 68216 (Pfam: 52.91%) 个 Unigene 获得 功能 注释 。 发 现 脂 质 代 谢 、 碳 
水 化 合 物 代谢 、 和 氨基 酸 代 谢 、 环 境 适应 、 次 级 代谢 物 生物 合成 、 信 号 转 导 和 翻译 等 途径 在 辣椒 水 渤 
胁迫 应 答 中 起 重要 作用 .(2) 从 辣椒 转录 组 数据 中 发 据 到 26 574 个 SSR 位 点 分 布 在 24 889 个 Unigene 
中 。SSR 的 出 现 频率 为 20.61%, 其 中 单 核 苷 酸 重复 所 占 比 例 (37.26% ) 最 高 ,其 次 是 三 核 苷 酸 (31.009%0) 
MIZER (25.44%) 重复 类 型 ， 三 者 占 EST-SSR 总 数 的 93.70%。 在 单 核 昔 酸 与 二 核 苷 酸 中 最 多 
的 基 序 类 型 为 A/T、AG/CT 和 ТС/СА, 然后 是 AT 和 TA; 三 核 背 酸 中 最 常见 的 基 序 类 型 是 TTG/CAA 
fll ACA/TGT. (3) 用 Primer 3 设计 了 EST-SSR 引物 10 002 对 , 随机 选择 30 对 引物 进行 PCR 扩 增 ， 
均 可 获得 有 效 扩 增 。 通 过 3 份 辣椒 材料 进行 扩 增 ， 其 中 7 对 引物 可 以 扩 增 出 目标 条 带 。 综 上 所 述 ， 
在 辣椒 中 优势 SSR 重复 类 型 的 基 序 结构 和 其 他 品种 基本 相近 ， 并 初步 探索 了 藻 椒 水 洲 胁 迫 应答 的 分 
子 机 制 ， 开 发 了 EST-SSR 标记 ， 为 辣椒 耐 涝 遗传 育种 提供 参考 。 
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Transcriptome characteristics analysis апа EST-SSR marker 


development of Capsicum annuum under waterlogging stress 
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Abstract: SSR molecular markers were obtained based on abundant transcriptome data under different 
waterlogging conditions in order to develop appropriate biological tools and explore the molecular 
mechanism of hot pepper response to waterlogging stress in this experiment. The results were as follows: (1) 
A total of 128 939 Unigenes were obtained from transcriptome analysis of hot pepper. The total length, 
average length, and GC content were 55 082 725 bp, 1 101 bp, and 40.57%, respectively. Compared with 
seven major functional databases, 102 123 (NR: 79.20%), 110 157 (NT: 85.43%), 70 203 (SwissProt: 
54.45%), 73 539 (КОС: 57.03%), 77 646 (KEGG: 60.22%), 77 442 (GO: 60.06%), and 68 216 (Pfam: 
52.91%) Unigenes obtained functional annotations. It was found that lipid metabolism, carbohydrate 
metabolism, amino acid metabolism, environmental adaptation, secondary metabolite biosynthesis, signal 
transduction, and translation play important roles in the response to waterlogging stress. (2) 26 574 SSR 
loci were found in 24 889 Unigenes from hot pepper transcriptome data. The frequency of SSR was 
20.61%, of which single nucleotide repeat accounted for the highest ratio (37.26%), followed by 
trinucleotide (31.00%) and dinucleotide (25.4496) repeat types, accounting for 93.7096 of the total 
EST-SSR. The motifs A/T, AG/CT, and TC/GA, followed by AT and TA, were the most abundant in single 
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nucleotide and dinucleotide. The most common types of trinucleotides were TTG/CAA and ACA/TGT. (3) 
10 002 pairs of EST-SSR primers were designed with Primer 3. 30 pairs of primers were randomly selected 


for amplification test, and all of them were effective. Seven pairs of primers could amplify the target bands 


in three hot pepper germplasms. To sum up, the motif structure of the most dominant SSR repeat type in 


hot pepper was basically similar to that of other varieties, and the molecular mechanisms of hot pepper 


waterlogging stress response were preliminarily explored. The EST-SSR markers were developed to 


provide reference for hot pepper waterlogging-tolerant genetics and breeding. 
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1.4 DNA 提取 和 PCR 扩 增 
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PCR 反应 体系 PCR 反应 程序 
PCR reaction system PCR reaction procedure 

10xPCR Buffer 2.0 uL 94 'C 预 变性 94 °С initial denaturation 3 min 
10 mmol-L''dNTP 1.0 uL 94 CC 变性 94 °С denaturation 1 min 
10 umol: L'R 1.0 uL 55 CC 退火 94 °С anneal 1 min 
10 umol:L-! F 1.0 uL 72 'C 延 促 94 'C extention 305 
Taq enzyme 1U 循环 次 数 94 °C number of cycles 35 
DNA 50 ng 727С МЕН 94 “С extention 5 min 
ddH2O 补 至 20hL Upto20uL 4 保存 94 С keeping со 


1.5 EST-SSR 标记 的 多 态 性 分 析 


银 染 显 色 和 照相 ， 分 析 EST-SSR 标记 的 多 态 性 效果 。 
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2.1 转录 组 测序 数据 的 组 装 分 析 
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Table 2 Summary of hot pepper transcriptome sequencing 
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用 10% 非 变性 聚 丙烯 酰胺 凝 胶 (PAGE) 电泳 检测 PCR 扩 增 产物 。 于 120 V 电泳 2.0 h 后 ， 进 行 
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样品 Unigene 数目 Q20 比例 GC 比例 总 长 度 平均 长 度 
Sample Unigene number 020 ratio (%) СС ratio (o) Total length (bp) Mean length (bp) 
CKr1 47 818 96.91 40.64 52 956 056 1107 
CKr2 45 912 97.06 40.80 50 958 549 1109 
СКЗ 48 997 96.91 40.57 54 843 142 1119 
Tiri 48 454 97.06 40.51 54 038 837 1115 
T1r2 49 661 97.24 40.60 55 118 249 1109 
Ті3 51447 96.98 40.39 58 720 692 1141 
Т2г1 51 689 97.35 40.56 57 158 191 1105 
T2r2 53 299 97.09 40.65 49 788 703 934 
Т213 50 685 97.21 40.50 57 497915 1134 
T3r1 49 580 97.12 40.81 53 356 736 1 076 
T3r2 52 224 97.05 40.31 59 813 512 1145 
T3r3 50 496 97.00 40.51 56 742 113 1123 
均值 Average 50 022 97.08 40.57 55 082 725 1101 


iE: rl. r2 和 r3 分 别 表 示 重 复 1、 重 复 2 和 重复 3。 


Note: r1, r2 and 13 represent replication 1, replication 2, and replication 3, respectively. 


对 不 同 处 理 辣 椒 植 物 根系 i 


行 转录 组 测序 ,构建 12 个 cDNA 文库 ,获得 Clean reads 共 


5153.99 Gb, 


对 其 组 装 去 见 余 后 , 得 到 Unigene 128 939 个 (图 DD 。 总 长 度 、 平均 长 度 、GC 含量 依次 为 55 082 725 


bp. 1101 bp 和 40.57%。 在 所 有 Unigene F, 57 243 个 基因 


长 度 介 于 200~1 000 bp 之 间 ， 所 占 比例 


为 44.40%，35 213 个 长 度 介 于 1000-2 000 bp 之 间 ， 所 占 比例 为 27.31%，19 321 个 长 度 介 于 2 000~ 
3000 bp 之 间 ， 所 占 比 例 为 14.98 %，17 162 个 长 度 大 于 3 000 bp， 所 占 比例 为 13.31%。 
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22 基因 的 功能 注释 


将 Unigene 比 对 到 NR、NT、SwissProt、KOG、KEGG、GO 和 Pfam 数据 库 ( 表 3) ， 分 别 有 


基因 长 度 Gene length (bp) 


1 辣椒 基因 长 度 分 布 
Fig.l Distribution of Unigene length in hot pepper 


刊 


102 123 (79.20%) . 110 157 (85.43%) . 70203 (54.45%) . 73 539 (57.03%) . 77 646 (60.22%), 
77 442 (60.06%) 以 及 68 216 (52.91%) 个 Unigene 获得 功能 注释 , 被 任意 一 个 数据 库 注 释 的 Unigene 
有 116057 个 ， 占 Unigene 总 数 的 90.0196. 

表 3 单 基因 功能 注释 


Table 3 Function annotation of Unigene 


数据 库 车 因数 量 比例 
Database Number of genes Ratio (%) 
NR 102 123 79.20 
NT 110 157 85.43 
SwissProt 70 203 54.45 
KOG 73 539 57.03 
KEGG 77 646 60.22 
GO 77 442 60.06 
Pfam 68216 52.91 


ЖК РЫН НЕМ DEGs 进行 GO 功能 注释 。 共 有 43 446 个 DEGs 被 注释 在 GO 数据 库 
中 (图 2), 可 分 成 分 子 功 能 、 细 胞 组 分 以 及 生物 过 程 三 大 类 。 分 子 功能 中 主要 方面 是 结合 binding), 
催化 活性 〈catalytic activity) 及 转运 活性 〈transporter activity) 。 细 胞 组 分 中 主要 方面 是 细胞 解剖 实 
体 (cellular anatomical entity) 、 胞 内 Cintracellular) 以 及 含 蛋 白 复 合 物 Cprotein-containing complex). 
在 生物 过 程 中 细胞 过 程 Ccellular process). 占据 主导 地 位 ， 其 次 是 代谢 过 程 (metabolic process). MÆ 
物 调 节 Cbiological regulation?) 。13 702 个 DEGs 被 注释 到 KEGG 通路 中 (图 3) 。 其 中 碳水 化 合 物 
代谢 Ccarbohydrate metabolism) 、 脂 质 代谢 Clipid metabolism) 与 氨基 酸 代谢 Camino acid metabolism) 
是 主要 的 代谢 途径 。 与 代谢 相关 的 DEGs 有 8 404 个 , 包含 碳水 化 合 物 (16.5290) 、 氨 基 酸 (9.22%). 
脂 质 〈7.03%) 、 其 他 次 级 代谢 物 的 生物 合成 “6.08%) 以 及 能 量 代 谢 (4.99%) 等 。 在 遗传 信息 处 
ЖІ (genetic information processing) 中 , 主要 为 翻译 Ctranslation) 和 折合 、 分 类 和 降解 (folding, sorting 
and degradation ) 以 及 转录 (transcription )3 个 过 程 。 在 环境 信息 处 理 Cenvironment information processing ) 
途径 中 主要 是 信号 转 导 (signal transduction) 与 跨 膜 运输 (membrane transport) 。 运 输 和 分 解 代 谢 
(transport and catabolism) 及 环境 适应 (environmental adaptation) 是 细胞 过 程 和 有 机 系统 中 主要 途 
径 。 这 说 明 在 淹 水 过 程 中 辣椒 受到 碳水 化 合 物 代谢 、 脂 质 人 代谢、 氨基酸 代谢 、 信 号 传导 等 途径 的 协 
同 作 用 ， 这 些 通路 可 能 在 辣椒 水 游 胁迫 应 答 中 起 到 重要 作用 。 
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TE; 8. 翻译 调节 活性 ，9 分 子 换 能 器 活性 ，10. 其 他 ; 11. 细胞 解剖 实体 ，12. 细胞 内 ;，13. BERE АИ: 14. #8 
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程 ，28. 生物 间 的 相互 作用 ; 29. 增长 ，30. 其 他 。 


1. Binding; 2. Catalytic activity; 3. Transporter activity; 4. Structural molecule activity; $. Transcription regulator activity; 6. 


Molecular function regulator; 7. Antioxidant activity; 8. Translation regulator activity; 9. Molecular transducer activity; 10. 
Other; 11. Cellular anatomical entity; 12. Intracellular; 13. Protein-containing complex; 14. Cellular process; 15. Metabolic 
process; 16. Biological regulation; 17. Response to stimulus; 18. Regulation of biological process; 19. Localization; 20. 
Developmental process; 21. Signaling; 22. Multicellular organismal process; 23. Reproduction; 24. Reproductive process; 25. 


Negative regulation of biological process; 26. Positive regulation of biological process; 
Interspecies interaction between organisms; 29. Growth; 30. Other. 


图 2 辣椒 DEGs 的 GO 注释 
Fig.2 GO annotation of hot pepper DEGs 
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l. 核 背 酸 代谢 ，2.， 聚 糖 生物 合成 和 代谢 ，3. 本 类 和 聚 酮 类 的 代谢 ，4. 辅 因子 和 维生素 的 代谢 ，5. 其 他 氨基 酸 的 


谢 ，6. 能 量 代谢 ，7. 其 他 次 级 代谢 产物 的 生物 合成 ; 8. 脂 质 代 谢 ，9. 氨基 酸 代谢 ; 


eu 


10. pend КИ; п. 全 
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和 概览 图 ，12. 复制 和 修复 ，13. R; 14.18. SAME 15. 翻译，16. 膜 运输 ，17. 信号 转 导 ; 18. 运输 和 


分 解 代 谢 ，19. 环境 适应 。 


1. Nucleotide;metabolism; 2. Glycan biosynthesis and metabolism; 3. Metabolism of terpenoids and polyketides; 4 


Metabolism of cofactors and vitamins; 5. Metabolism of other amino acids; 6. Energy metabolism; 7. Biosynthesis of other 


secondary metabolites; 8. Lipid metabolism; 9. Amino acid metabolism; 10. Carbohydrate metabolism; 11. Global and 


overview maps; 12. Replication and repair; 13. Transcription; 14. Folding, sorting and degradation; 15. Translation; 16. 


Membrane transport; 17. Signal transduction; 18. Transport and catabolism; 19. Environmental adaptation. 
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3 UB DEGs 的 KEGG 注释 
Fig.3 KEGG annotation of hot pepper DEGs 


2.3 EST-SSR 的 频率 和 分 布 特点 
使 用 MISA 对 所 有 的 Unigene 进行 SSR 位 点 检测 ， 共 发 现 26 574 个 
Unigene 当中 , 其 中 23 451 个 Unigene 含有 单一 SSR, 1 438 个 Unigene 包含 


SSR 位 点 分 布 在 24 889 个 
3123 个 SSR 位 点 , SSR 


位 点 出 现 频 次 (SSR 数目 占 Unigene 总 数 百分比 ) 为 20.61%，SSR RÆ (E SSR 的 Unigene Ж 


p Unigene 数 百分比 ) 为 19.3096. № 4 可 以 看 出 ,辣椒 EST-SSR 序列 主要 以 4-10 次 重复 为 主 ， 


315411 4%, 152 EST-SSR 的 $8.00% ;其 次 是 11~20 次 重复 , 共 10 125 个 , 占 总 EST-SSR 的 38.1096; 
20 次 以 上 的 重复 较 少 , 共 1038 个 , 占 3.91%。 在 已 鉴定 的 SSR F, 单 核 音 酸 基 序 SSR 最 丰富 (9 902, 


37.26%) , К = НӘ (8 238, 31.00%) 、 二 核 昔 酸 (6 760, 25.44%) 
TIZER (466, 1.75%) 和 四 核 背 酸 (370, 1.39%) 基 序 SSR。 
表 4 辣椒 EST-SSR 的 类 型 、 数 量 及 分 布 频率 


А НВ (838. 3.15%). 


Table 4 Type, number and distribution frequency of EST-SSR іп hot pepper 


SSR 重复 类 型 重复 次 数 Repeat number A 比例 

SSR repeat type 4 5 6 7 8 9 10 11-20 >20 Total Ratio (96) 
单 核 背 酸 Mono-nucleotide 0 0 0 0 0 0 0 8 991 911 9 902 37.26 
二 核 苷 酸 Di-nucleotide 0 0 2422 1572 806 486 416 943 115 6760 25.44 
三 核 昔 酸 Tri-nucleotide 0 4510 1945 969 456 100 101 148 9 8238 31.00 
ДЕНЕ Tetra-nucleotide 0 235 85 18 6 2 5 18 1 370 1.39 
TIZH Penta-nucleotide 340 76 24 5 11 2 2 4 2 466 1.75 
7 Н Hexa-nucleotide 568 113 59 49 12 10 6 21 0 838 3.15 
总 计 Total 908 4934 4535 2613 1291 600 530 10125 1038 26574 
比例 Ratio (96) 342 18.57 1707 9.83 486 226 199 3810 3.91 


2.4EST-SSR 基 序 重复 类 型 和 频率 特征 
从 辣椒 EST-SSR 核 苷 酸 的 基 序 类 型 来 看 ，EST-SSR 以 单 核 昔 酸 为 主要 类 型 ， 约 9 902 个 ， 占 总 


SSR 的 37.26%， 其 


л ІІ 8 238 个 (31.00%) MER 6 760 个 (25.44%) ， 三 者 共 占 检 


测 出 SSR 总 数 的 93.70% 。 在 单 核 昔 酸 中 ，AMT 是 主要 类 型 ， 占 全 部 单 核 昔 酸 的 95.58%， 其 次 为 三 
核 音 酸 ， 以 TIG/CAA、ACA/TGT 为 主要 类 型 ， 分 别 占 三 核 背 酸 SSR 的 18.10%、12.71%。 在 二 核 
TER. Ц AG/CT. GA/TC. АТЖ TA 的 比例 最 高 ， 占 所 有 二 核 苷 酸 SSR 总 量 的 23.30%、21.02%、 
20.58% 和 17.25%。 而 四 、 五 、 六 3 种 核 昔 酸 基 序 出 现 频 次 均 较 低 , 三 者 一 起 共 占 SSR 总 数 的 6.3096; 
四 核 苷 酸 中 ， 以 TITA/TAAA、AATA/TATT Ж АААТ/АТТТ 的 比例 最 高 ， 分 别 占 四 核 苷 酸 SSR 的 
13.78%、10.27% 和 9.73%; ЋЕ, Ц ATGGT、ACTCA 所 占 比 例 最 高 ， 各 占 五 核 苷 酸 SSR 


的 6.01% 和 4.0896; ENER 


№ 3.10% (K5). 


, Ц СААСАС. GAGCTG 的 数量 最 多 , 各 占 六 核 背 酸 SSR 的 3.82% 


表 5 BR EST-SSR 基 序 的 分 布 


Table 5 Distribution of EST-SSR motif in hot pepper 


重复 类 型 SSR 基 序 重复 次 数 重复 类 型 SSR 基 序 重复 次 数 
Repeat type SSR motif Repeat number Repeat type SSR motif Repeat number 
单 核 苷 酸 9 902 AGC/GCT 192 
Mono-nucleotide 
A/T 9 464 ACC/GGT 189 
C/G 438 ATG/CAT 184 
二 核 音 酸 6 760 TCC/GGA 183 
Di-nucleotide 
AG/CT 1 575 AGG/CCT 169 
TC/GA 1421 TGC/GCA 144 
CA/TG 622 TAC/GTA 79 
AC/GT 529 GCC/GGC 73 
AT 1391 ТАС/СТА 65 
ТА 1166 ТСС/ССА 60 
GC 44 CCG/CGG 58 
CG 12 ACT/AGT 47 
ZER 8 238 CGC/GCG 38 
Tri-nucleotide 
TTG/CAA 1491 GAC/GTC 27 
ACA/TGT 1 047 ACG/CGT 6 
TTC/GAA 739 Ji ER 370 
Tetra-nucleotide 
AAG/CTT 488 TTTA/TAAA 51 
AAC/GTT 384 AATA/TATT 38 
AGA/TCT 333 AAAT/ATTT 36 
TGG/CCA 309 其 他 Others 245 
ААТ/АТТ 305 TIZER 466 
Petra-nucleotide 
TCA/TGA 286 ATGGT 28 
ATA/TAT 240 ACTCA 19 
CAC/GTG 239 其 他 Others 419 
CAG/CTG 233 AGREES 838 


Hexa-nucleotide 


ATC/GAT 217 GAAGAG 32 

TAA/TTA 210 GAGCTG 26 

CTC/GAG 203 其 他 Others 780 
2.5 EST-SSR 的 长 度 统计 


EST-SSR 的 长 度 范围 
523 (20.78%) 个 SSR 位 点 (图 4) 。 


FH ER 


为 12-110 Бр, 


12909 (10.95%) 个 位 点 ， 二 核 


ERER ZERP, 


其 中 12 bp 15 bp 分 布 最 多 ， 分 别 有 5331 (20.06%) 415 


最 常见 的 片段 长 度 为 12 bp， 在 单 


昔 酸 中 有 2422 (9.11%) Муж. ММН 


长 的 片段 分 别 是 102 bp 和 96 bp。 在 三 核 昔 酸 中 ， 主 要 长 度 类 型 是 15 bp 和 18 bp， 二 者 分 别 有 4 510 


(16.97%) 和 1 945 (7.32%) 个 位 点 ， 二 者 占 三 核 苷 酸 
以 20 bp 为 主 ， 
个 位 点 ，24 bp 
占 SSR 总 数 的 22.65 %; 
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位 点 总 数 的 78.36%. РЛ TUBE RIY 
分 别 有 235 (0.8894) 和 340 (1.2894) 个 位 点 。 六 
占 绝 大 多 数 (568, 2.14%) 。 在 本 研究 中 ，SSR 
20 556 条 SSR 分 布 于 


x\ 核 昔 酸 中 最 长 的 为 90 bp， 检 测 到 4 
J 6018 条 SSR 的 长 度 大 于 20 bp, 


12-19 bp 之 间 ， 占 SSR 总 数 的 77.3596. 
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图 4 SSR 长 度 分 布 图 


Fig. 4 Distribution of SSR length 


2.6 辣椒 EST-SSR 引物 筛选 与 验证 
使 用 Primer 3 对 含有 SSR 的 21 008 条 EST 序列 设计 了 10 002 对 SSR 引物 。 为 验证 其 有 效 性 ， 
随机 选择 30 对 引物 进行 合成 ， 引 物 


DNA 进行 PCR 7М500105, 


个 辣椒 材料 


对 ， 可 作为 后 续 参 考 使 用 。 引 4 


可 以 扩 增 出 目的 条 带 


CL10579.Contig2 АП 6940 、 
CL10564.Contigl АП 6936. CL10056.Contig8 All 6589. 


rH > 


B6, КУА. 


‘ZHC1” 和 ‘ZHC2’ 3 个 辣椒 材料 的 


图 5 可 知 ， 所 挑选 的 全 部 引物 均 可 扩 增 ， 而 其 中 7 对 引物 在 3 


CL10070.Contigl All 6593 


表 6 30 对 SSR 引物 信息 


У 


占 挑选 引物 总 数 的 23.33%， 推 测 可 用 的 EST-SSR 数量 有 2 333 
0 2 511 Unigenel2971 All 10480. CL10067.Contig! АП 6591. 


CL10751.Contigl All 7072. . 


Table 6 30 pairs of SSR primer information 


引物 序列 (523) 


预期 产物 大 小 


EREA 


SSR ID CU . Expected product 
Primer sequence (5'—3") Repeat motif size (bp) 
А ССАААТССАСТАСТААССАССАС 
CL10034.Contig3 АП 6578 TTCCTCCTCTTCCGTTTCTACTT GAAGAG (6X7) 132 
: CGATCCTCATCGATCTAACTTTG 
CL10053.Contig3 All 6584 ACCGCTTAATCATCTC CA AT (2X6) 114 
CL10056.Contig7 All 6586 BO d C (1X13) 152 


TCCATATACATGATCAGCACTCG 


CL10056.Contig8 АП 6589 
CL10067.Contigl All 6591 
CL10070.Contigl All 6593 
CL1018.Contig2 All 1327 
CL1047.Contig27 АП 1360 
CL10499.Contig3 АПИ 6884 
CL10534.Contig4 АП 6919 
CL10564.Contigl АП 6936 
CL10579.Contig2 All 6940 
CL10604.Contig2 All 6943 
CL10668.Contigl АИ 6994 
CL10751.Contigl А 7072 
CL10810.Contig3 АП 7117 
CL11228.Contigl3 All 7734 
Unigenell434 АП 10207 
Unigenell55 АИ 8659 
Unigene1203 All 8666 
Unigene12494 АП 10392 
Unigene1264 All 8674 
Unigene12971 А 10480 
Unigenel3561 АП 10584 
Unigenel375 All 8685 
Unigene14198 АП 10688 
Unigenel4412 All 10734 
Unigene14997 АП 10836 
Unigenel5303 АП 10895 


Unigenel722 АШ 8697 


CACTTCCACAGACCACAAAAATA 
ACTTCTACCGTCAATCACCTGAC 
TCAAGAGATCAAAATCAATGCCT 
GACGATGATGATGAAGATGATGA 
TTGGTTGGTCAAAAGAACAGATT 
TCACAATTTCAATCCCCATAAAC 
GCTGTCGTAATTGCGTAGCTAGT 
AAGGCGGCTATAGATGGGTATAA 
АААААСТТССТТАТАСТСССТССС 
ACATTATATGACAAGGGAGCGTG 
ATCTTACCCTTCAGACCCCACTA 
TTCTAAATGTGCAGCAAAGTGAA 
CATTTCTCCATTTTACTAAGCTCCA 
САТТСААССАТАСААСССТТТТС 
CAGCTGCTTAAAGTATAAGGCGA 
ATAACATGTAAGCTCCAACCCCT 
CAACGGACAATAGTGGGATTACA 
CACCTTATTTGTGACCGAGACAT 
TTTGGTTGTAATTTTGGTGTTATGA 
TAATCATCGAACTTCCGTTTGTT 
GAGACACACGTTCCATCATCTTC 
GAACGTATCTTGCTCCTTGATGA 
TAATTTCTTTITGCGGCAGTTCTA 
TCCAGTTGCAAAATTAGGAAAGA 
TTTATAACTCCCTGAATCCACCA 
TTGTTAAGCTCAAATCGGAAAAT 
AGGTAGCGGTATTGGTATGGACT 
CCACTGCATGAGGACACTAAAAT 
ACTAGGTGGGAATACACTGGGTT 
AAGATCATGAAAGCAGCAAACAT 
CCCATACCCGGATTATTACTCTT 
TTTGTGCCAGACAGCAATATTTA 
CAGCCACACTTAGCAACTTCTTT 
CCTGTACCACGCTTGTAGGATTA 
GATGTTATGGGTGTGGAAAAGAA 
CTATTGCTTGACTCTCAGGTGCT 
ATCTCCACTTTGTGAGACTGGAA 
TTTGTGTTCGGCAAGAAAAATA 
GGACTGCGTACATTCTACCCTC 
GAATCATCAAATGGGATACAGGA 
TATTGGAAGGTTGTTGTCTCTGC 
GAGCAAAACGAAGGAAGAAAAAT 
AATAATGCCTCGTTGTTTCAAGA 
CTATCGCGTACGAAGATGTCTGT 
GCAGCTTCCTTCATTTTGTGTAG 
ACTAGGTGGGAATACACTGGGTT 
TTCGGGTTGTAATAATTGGACTG 
CCACGGTCTCTTGGTAAAGTGTA 
GAAAATGTTTTCCTCCACACTGA 
GTGGTACGGTATGCGTACACTTT 
CTCACCAAAACAATGGAACATTT 
TGAGGTAGTGCCTAGTGGTATGG 
TCCCTGAGGAGTATAATTTGCCT 
AATTCAAGAACTTGCCTTGATGA 
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1-21. = FÉ Ji H^ 为 Unigenel2971 АИ 10480 .  CL10067.Contigl All 6591 .  CL10579.Contig2 All 6940 、 

CL10070.Contigl АП 6593, CL10751.Contigl All 7072. CL10564.Contigl АП 6936. CL10056.Contig8 All 6589 引物 
的 扩 增 结果 ， 每 对 引物 中 以 “ZHC1”、“ZHC2”、“ 大 方 皱 椒 ” 的 顺序 点 样 。M. DL2000 Marker. 

1-21. Тһе orders of sampling are the amplification results of Unigenel2971 А 10480, CL10067.Contigl АИ 6591, 
CL10579.Contig2 All 6940, | CL10070.Contigl All 6593, | CL10751.Contigl All 7072, | CL10564.Contigl All 6936, 
CL10056.Contig8 All 6589 primers, respectively. Among each pair of primers, the samples аге *ZHCI', *ZHC2' and 
*Dafangzhoujiao', respectively. M. DL2000 Marker. 


图 57 对 EST-SSR 引物 的 扩 增 结 
Fig. 5 Amplification results of seven pairs of EST-SSR primers 


3 讨论 与 结论 
3.1 辣椒 转录 组 数据 组 装 与 功能 注释 


通过 植物 转录 组 检测 技术 可 以 获取 大 量 的 转录 本 信息 ， 这 为 植物 基因 表达 的 综合 分 析 提 供 了 合 
理 而 可 信和 的 数据 资源 (机 新平 等，2014) 。 因 此 ， 在 淹 水 胁迫 下 辣椒 转录 组 信息 的 系统 分 析 为 全 面 
了 解 辣椒 耐 涝 分 子 机 制 和 挖掘 新 的 耐 涝 基因 奠定 基础 。 本 研究 对 不 同 淹 水 时 间 的 辣椒 根系 进行 转录 
组 测序 ， 对 数据 组 装 共 获 得 128 939 个 Unigene。 把 这 些 Unigene Æ МК. NT, Swissprot, KEGG, 
KOG, Pfam 和 GO 数据 库 中 加 以 注释 , 得 到 注释 Unigene 共有 116 057 个 ， 占 总 Unigene 的 90.01%, 
有 12 882 个 Unigene 没有 得 到 注释 。 与 其 他 植物 相 比 《张小红 等 ，2022; BÆ, 2022), ЖК 
胁迫 下 辣椒 转录 组 测序 获得 的 基因 数量 及 注释 效率 均 较 高 。 组 装 得 到 的 Unigene 不 能 在 已 知 相关 基 
因数 据 库 得 到 注释 ， 这 种 现象 是 普遍 存在 的 ， 这 与 所 得 部 分 Unigene 片段 太 短 、 相 关 数 据 库 基 因 注 
释 信 息 缺 乏 、 辣 椒 中 存在 新 基因 等 因素 都 有 关联 ( 张 少 平等 ，2016) 。 可 以 对 未 被 注释 的 基因 进 一 
步 研 究 ， 确 定 这 些 基因 在 植物 生长 发 育 过 程 中 的 作用 ， 从 而 丰富 基因 数据 库 〈 马 彦 军 等 ，2020) 。 
本 研究 对 DEGs 进行 KEGG 注释 时 ， 发 现 碳水 化 合 物 、 握 基 酸 、 脂 质 等 代谢 注释 最 多 ， 其 次 为 翻译 、 
折 县 、 遗 传 信息 分 类 和 降解 以 及 信号 转 导 。 植 物 在 受到 水 涝 胁迫 的 时 候 ， 植 物 根系 缺 氧 导致 线粒体 
有 氧 呼吸 受到 极 大 抑制 。 碳 水 化 合 物 代谢 对 植物 存活 至 关 重要 ， 在 此 过 程 中 ， 植 物 通过 积累 易 利 用 
糖 类 和 额外 丙酮 酸 等 物质 以 保持 其 能 量 供应 。 和 氨基酸 代谢 在 植物 应 对 非 生 物 胁迫 中 发 挥 着 重要 作用 
(Hildebrandt et al., 2018) 。 其 中 ， 对 胶 氨 酸 的 研究 最 为 广泛 ,但 其 他 氨基 酸 ， 如 支 链 氨 基 酸 〈 亮 氨 
酸 、 异 亮 氨 酸 和 强 氨 酸 ) 也 同样 重要 (Huang et al., 2017), 其 氧化 会 产生 大 量 的 三 磷酸 腺 苷 (Hildebrandt 
etal,2015) ; 而 丙 氨 酸 和 天 冬 氨 酸 在 其 相应 氨基 转移 酶 作用 下 通过 影响 草 酰 乙酸 的 量 而 参与 雁 酮 酸 
的 再 生 ， 可 以 为 植物 逆境 生存 提供 物质 与 能 量 ， 这 可 能 是 ZHC2 辣椒 耐 涝 性 强 的 原因 之 一 。 在 脂 质 
代谢 过 程 中 ， 耐 缺 氧 型 个 体 脂 质 分 解 加 强 ， 其 分 解 为 甘油 和 游离 脂肪 酸 ， 甘 油 可 用 于 碳 和 能 量 供应 
以 及 不 定 根 发 育 ， 而 游离 脂肪 酸 可 为 新 生成 的 细胞 提供 成 分 。 当 辣椒 受到 水 涝 胁迫 时 ， 碳 水 化 合 物 
代谢 可 以 产生 足够 能 量 使 植物 维持 多 种 生理 生化 反应 ， 同 时 植物 需要 合成 大 量 的 酶 来 催化 体内 的 多 
种 生理 生化 反应 ;将 受到 的 刺激 信号 进行 传导 ， 以 便 植物 能 产生 应 激 反 应 来 应 对 不 良 环境 造成 的 影 
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分 子 机 制 。 
3.2 辣椒 转录 组 EST-SSR 的 重复 类 型 与 频率 特征 

本 研究 发 现 26 574 个 SSR 位 点 分 布 于 128 939 ЖОЕЛ Unigene 中 ，EST-SSR 出 现 频率 为 
20.61%， 高 于 Yi (2006) 、 刘 峰 等 〈2012) 、 魏 兵 强 等 (2013) 的 辣椒 EST-SSR 结 ЕТЕ 
Ж Ж CQiu etal., 2010) . Ж (Kunkeaw et al., 2011) . 6205 〈 刘 思 思 等 ，2021) 的 EST-SSR 
结果 ,这 可 能 是 由 于 物种 间 SSR 信息 的 差异 造成 的 ,也 可 能 因为 用 于 分 析 EST 数量 在 不 同 物种 间 各 
不 相同 , 或 者 用 于 搜索 SSR 所 使 用 的 软件 算法 及 所 设 定 的 参数 不 同 ( 吴 智明 等 ,2012 ) . ЗХ EST-SSR 
单 核 苷 酸 频 率 最 高 (37.26%) ， 其 次 是 三 核 苷 酸 (31.00%) MIZER (25.44%) . TEPREUR ELT 
№ EST-SSR 中 ， 绝 大 部 分 基 元 为 AT， 这 与 魏 兵 强 等 (2013) 、 刘 峰 等 (2012) 的 结果 一 致 。 在 二 
核 昔 酸 重复 类 型 中 ， 出 现 频 率 最 高 的 是 AG/CT 和 TC/GA， 其 次 是 AT ЖТА, ifj GC/CG 出 现 频率 
低 ， 这 与 Yi (2006) . Kantety 2 (2002) 、 张 宇 等 (20100 在 辣椒 上 的 研究 结果 基本 一 致 ， 而 
且 与 珍珠 村 (Selthilvel et al., 2008) 、 石 忒 〈 李 青竹 等 ，2021) 、 蝴 蝶 兰 〈 张 水 明 等 ，2012) 和 毛竹 
( 张 智 俊 等 ，2011) 的 结果 相似 ， 说 明 EST-SSR 在 其 发 生 和 进化 过 程 中 具有 高 度 保守 性 。GA/TC 在 
mRNA 水 平 上 可 以 代表 遗传 密码 子 САС. AGA, UCU 和 СОС, 并 分 别 可 以 翻译 成 精 氨 酸 、 谷 氨 酸 、 
丙 氨 酸 和 亮 氢 酸 ， 而 丙 氨 酸 和 亮 氨 酸 分 别 以 8% 和 10% 的 高 频率 存在 于 蛋白 质 中 ， 这 可 能 是 GA/TC 
在 EST SISSE Капу et al., 2002 )。 在 三 核 苷 酸 中 , 出 现 频率 高 的 是 TTG/CAA、ACA/TGT， 
这 与 Kumpatla 等 〈2005) 和 Yi 等 (2006) 对 辣椒 EST-SSR 的 研究 结果 相符 合 。 但 刘 峰 等 (2012) 
研究 认为 ， 辣 椒 EST-SSR REER 重复 序列 外 ， 最 多 的 是 三 核 苷 酸 重复 序列 AAC/GTT 和 
AAG/CTT， 其 次 是 二 核 苷 酸 重 复 序列 。 这 可 能 是 SSR 搜索 标准 〈 基 序 长 度 、 重 复 次 数 等 ) 、 分 析 软 
件 及 数据 库 大 小 不 同 造成 的 。 
3.3 辣椒 转录 组 EST-SSR BJ ds E 

本 研究 中 共有 6018 条 SSR 长 度 大 于 20 bp， 占 全 部 SSR 总 数 的 22.65%; 20 556 条 SSR 长 度 介 
于 12~19 bp 之 间 , 占 所 有 SSR 总 数 的 77.35%, АВН EST-SSR 具有 较 好 的 多 态 性 (Temnykh etal., 
2001) ， 这 与 盛 文 涛 等 (2019) 的 研究 结果 基本 一 任 ， 可 用 于 辣椒 分 子 标记 研究 。 根据 26 574 条 EST 
序列 设计 了 10 002 对 SSR 位 点 特异 性 引物 ， 从 中 随机 挑选 了 30 对 引物 进行 PCR 验证 ， 都 可 以 实现 
有 效 扩 增 ,EST 数据 量 大 和 较 高 的 拼接 质量 应 是 扩 增 效率 高 的 原因 。30 对 扩 增 引物 中 ,有 7 对 (23.3%) 
引物 在 3 份 辣 椒 中 表现 出 多 态 性 ， 低 于 李 永 平等 (2016) 的 结果 (35.5%) ， 其 原因 可 能 与 本 研究 所 
选用 的 3 份 辣椒 材料 均 为 贵州 地 方 品 H'ZHCI'. 'ZHC2' 为 朝天 椒 ， 材 料 间 的 遗传 背景 差异 小 有 
关 。 2. 而 转录 区 的 序列 通常 比较 保守 。 因此 ， 一 般 来 讲 EST-SSR 
所 检测 到 的 多 态 性 要 低 于 基因 组 SSR。 但 多 态 性 检测 能 力 的 评价 也 与 所 测试 的 植物 材料 有 关 ; 
如 果 所 用 的 植物 材料 遗传 背景 差异 较 大 ， 则 标记 检测 的 多 态 性 就 高 ， 反 之 ， 则 标记 的 多 态 性 就 
会 大 大 降低 。 应 用 EST-Genome. Phrap. Clustalw. BLAST 等 软件 对 EST 序列 进行 精确 分 析 增 
加 供 试 材料 基因 型 与 数量 是 提高 EST-SSR 标记 多 态 性 和 价值 性 的 有 效 途 径 〈 张 宇 等 ，2010) 。 
因为 EST-SSR 是 对 基因 内 部 变异 的 一 种 直接 评价 ， 所 以 它 将 可 能 与 某 些 表 型 、 生 理 生化 特征 或 某 个 
特定 的 环境 适应 型 相 联 系 ， 反 应 植物 基因 表达 的 转录 部 分 〈 姚 利 华 等 ，2008) 。 挑 选 的 EST-SSR 标 
记 可 用 于 遗传 多 样 性 分 析 与 分 子 标 记 辅 助 育 种 。 由 于 其 丰富 的 多 态 性 信息 含量 ，EST-SSR 也 可 为 遗 
传 连锁 图 谱 构 建 等 葛 定 基础 。 下 一 步 可 寻找 与 辣椒 耐 涝 基因 连锁 的 EST-SSR 标记 ， 以 应 用 于 辣椒 而 
济 育 种 研究 。 
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